Nghi bị DeepSeek lợi dụng, công ty AI Mỹ vẫn khó ngăn chặn
Công ty AI Mỹ đang gặp khó khăn trong việc ngăn chặn DeepSeek, một công ty từ Trung Quốc, bị nghi ngờ lợi dụng các mô hình của OpenAI và Meta để phát triển AI giá rẻ. Sau khi chatbot DeepSeek ra mắt với khả năng cạnh tranh tương đương ChatGPT, nhiều chuyên gia công nghệ lo ngại rằng DeepSeek đã sao chép công nghệ từ các công ty Mỹ và phát triển sản phẩm với chi phí thấp, phát hành miễn phí.
DeekSeek bị cáo buộc sử dụng kỹ thuật chưng cất, tức là tận dụng các mô hình AI đã có sẵn để đánh giá và đào tạo mô hình mới. Kỹ thuật này giúp tiết kiệm thời gian và chi phí đầu tư, trong khi vẫn đạt được kết quả tương tự.
Ảnh Lưu Quý Chưng cất là kỹ thuật phổ biến trong lĩnh vực AI, nhưng có thể vi phạm điều khoản của một số dịch vụ. OpenAI cấm người dùng sao chép dịch vụ hoặc dùng đầu ra để phát triển mô hình cạnh tranh. Nhà phát triển ChatGPT cho biết có nhóm tại Trung Quốc sử dụng phương pháp này để sao chép mô hình AI của Mỹ và đang xem xét liệu DeepSeek có vi phạm hay không.
Là đơn vị phát triển AI hàng đầu, OpenAI thực hiện các biện pháp bảo vệ sở hữu trí tuệ, nhưng chưa công bố chi tiết quy trình cụ thể. Có dấu hiệu cho thấy DeepSeek đã chiếm dụng trái phép công nghệ AI của Mỹ. Howard Lutnick, người được Trump đề cử làm Bộ trưởng Thương mại, cho rằng DeepSeek không minh bạch và cam kết thực thi các quy định hạn chế để duy trì vị thế dẫn đầu về AI.
DeepSeek chưa bình luận về các cáo buộc. Theo các chuyên gia, ngăn chặn các công ty chưng cất là khó khả thi. Naveen Rao, Phó chủ tịch AI tại Databricks, cho rằng việc học hỏi từ đối thủ là điều bình thường trong ngành AI, và điều này cũng xảy ra ở nhiều lĩnh vực khác. Nếu thông tin có thể trích xuất, các công ty sẽ làm như vậy để giành lợi thế.
Theo Reuters, DeepSeek có ưu điểm là có thể sử dụng một lượng dữ liệu nhỏ, dưới một triệu mẫu, từ mô hình lớn để nâng cao chất lượng câu trả lời cho mô hình nhỏ. Trong khi đó, các dịch vụ như ChatGPT có hàng trăm triệu người dùng, khiến việc phát hiện truy cập quy mô lớn trở nên khó khăn. DeepSeek cũng được cho là học hỏi từ Meta, nhưng cả hai đều phát triển theo hướng nguồn mở, gây khó khăn trong việc xác định liệu DeepSeek có vi phạm hay không.
Việc chưng cất mô hình không thể dừng lại khi sử dụng các mô hình nguồn mở như Llama, theo Umesh Padval, Giám đốc điều hành tại Thomvest Ventures. Đại diện Meta cho biết giấy phép của Llama yêu cầu người dùng phải công khai thông tin sử dụng. DeepSeek xác nhận đã sử dụng Llama cho một số phiên bản tùy chỉnh, nhưng không rõ liệu có sử dụng mô hình của Meta trong đào tạo AI trước đó hay không.
Meta từ chối bình luận về việc DeepSeek có vi phạm điều khoản dịch vụ hay không. Để ngăn chặn rủi ro chưng cất trái phép các mô hình AI, chuyên gia từ một phòng thí nghiệm AI lớn cho rằng cần áp dụng yêu cầu xác minh khách hàng nghiêm ngặt, giống như các công ty tài chính. Tuy nhiên, điều này còn phụ thuộc vào quy định của chính quyền. Ngoài ra, một số công ty AI ở Mỹ đã chặn truy cập từ các địa chỉ IP Trung Quốc, nhưng hiệu quả của biện pháp này vẫn chưa chắc chắn.
Jonathan Ross, Giám đốc điều hành công ty AI Groq, cho biết việc chặn IP Trung Quốc chỉ là trò mèo vờn chuột vì dễ dàng bị vượt qua. Ông không biết giải pháp khác và kêu gọi ai có ý tưởng hãy chia sẻ. DeepSeek, được thành lập vào năm 2023 bởi Liang Wenfeng, đồng sáng lập quỹ đầu tư AI High Flyer, bắt đầu phát triển vào tháng 4 năm 2023, với mục tiêu hướng tới siêu trí tuệ nhân tạo tổng quát AGI, tương tự như OpenAI và nhiều công ty khác.
DeepSeek cho biết họ sử dụng 2.048 card đồ họa Nvidia H800 và 5,6 triệu USD để đào tạo mô hình V3 với 671 tỷ tham số, ít hơn nhiều so với chi phí của OpenAI và Google cho các mô hình tương đương. Một số chuyên gia nhận định rằng mô hình này có thể đã được huấn luyện dựa trên kết quả từ GPT-4.
Nguồn:vnexpress.net/nghi-bi-deepseek-loi-dung-cong-ty-ai-my-van-kho-ngan-chan-4844504.html